我们一直在关注随机化实验中的有限总体视角, 我们把所有潜在输出看作固定的数目. 即使潜在结果是随机变量, 我们也可以在有限视角下, 对它们取条件概率. 这样的好处是, 它关注实验设计, 对结果的生成过程有最小的额外假设. 但是, 它也被批评只有内部有效性, 但没有外部有效性.
- 内部有效性: 统计分析对手上的样本有效.
- 外部有效性: 统计分析对一个更广阔的群体有效.
目前所有的统计特性都是基于条件概率得到的, 那我们如何推广到一个更大的群体呢?
对于一些统计学家, 这只是一个技术问题. 我们可以改变统计框架, 假设这些单位是从一个更大的超总体抽样得到的. 这是一个方便的框架, 尽管它没有真正解决上面的问题.
1 CRE
假设 来自一个超总体. 则我们可以去掉下标 . 稍微滥用一下记号, 定义总体平均因果效应为 在超总体的框架下, 我们可以得到 CRE
此时
这里 可以直接由观测结果表示, 因此它是非参数可识别的.
(1.1) 立即推出, 我们有一个矩估计量 . 在 条件下, 这就是一个标准的双样本检测问题. 我们有
在 IID 采样下, 样本方差是无偏的, 所以 Neyman 的方差估计量对于 是无偏的. 因此就没有保守性的问题了.
我们还可以讨论协变量调整. 基于 OLS: 我们有 因为 均值为 . 如果采样的版本记为 , 则 的协变量调整为 如果 , 这退化为 Lin 的估计量 ( (2.1)) .
不过 EHW 方差估计量没法对 适用, 因为在超总体采样的时候会有额外的不确定性. 我们可以进行如下修正: .
2 扩展到 SRE
依然假设 . 假设协变量离散 .
此时 从而